AWK একটি শক্তিশালী প্রোগ্রামিং ভাষা যা টেক্সট প্রসেসিং এবং ডেটা বিশ্লেষণের জন্য ব্যাপকভাবে ব্যবহৃত হয়। এই ভাষায় substring
এবং split
ফাংশন ব্যবহার করে টেক্সটের নির্দিষ্ট অংশগুলি আলাদা করা যায়। নিচে এই দুটি ফাংশনের ব্যবহার এবং উদাহরণগুলি আলোচনা করা হলো।
AWK এ substr()
ফাংশন ব্যবহার করে একটি স্ট্রিং থেকে নির্দিষ্ট অংশ বের করা যায়। এর সিনট্যাক্স নিম্নরূপ:
substr(string, start, length)
awk '{ sub_str = substr($1, 1, 3) # প্রথম কলামের প্রথম 3 অক্ষর নিন
print "Substring of " $1 " is: " sub_str
}' filename.txt
এখানে, প্রথম কলামের প্রথম তিনটি অক্ষর বের করা হয়েছে।
AWK এ split()
ফাংশন ব্যবহার করে একটি স্ট্রিংকে বিভক্ত করে আলাদা আলাদা অংশে রূপান্তর করা যায়। এর সিনট্যাক্স নিম্নরূপ:
split(string, array, delimiter)
awk '{
split($0, arr, ",") # সম্পূর্ণ লাইনে কমা ব্যবহার করে বিভক্ত করুন
for (i = 1; i <= length(arr); i++) {
print "Element " i ": " arr[i] # প্রতিটি উপাদান প্রিন্ট করুন
}
}' filename.txt
এখানে, পুরো লাইনে কমা দিয়ে বিভক্ত করে একটি অ্যারেতে সংরক্ষণ করা হয়েছে এবং তারপর প্রতিটি উপাদান প্রিন্ট করা হয়েছে।
নিচে একটি উদাহরণ দেওয়া হলো যেখানে substr
এবং split
উভয় ফাংশন একসাথে ব্যবহার করা হয়েছে:
awk '{
split($0, arr, " ") # লাইনে স্পেস দ্বারা বিভক্ত করুন
first_name = arr[1] # প্রথম নাম নিন
last_name = arr[2] # শেষ নাম নিন
initials = substr(first_name, 1, 1) substr(last_name, 1, 1) # প্রথম এবং শেষ নামের প্রথম অক্ষর নিন
print "Initials: " initials
}' filename.txt
এখানে, প্রথম এবং শেষ নামের প্রথম অক্ষরগুলো আলাদা করে তাদের ইনিশিয়াল তৈরি করা হয়েছে।
AWK তে substr()
এবং split()
ফাংশন ব্যবহার করে স্ট্রিংগুলির সাথে কাজ করা অনেক সহজ এবং কার্যকর। substr()
ফাংশন ব্যবহার করে স্ট্রিংয়ের একটি নির্দিষ্ট অংশ বের করা যায়, এবং split()
ফাংশন ব্যবহার করে একটি স্ট্রিংকে বিভিন্ন অংশে বিভক্ত করা যায়। এই ফাংশনগুলি টেক্সট বিশ্লেষণ এবং ডেটা প্রক্রিয়াকরণের সময় বিশেষভাবে কার্যকরী। AWK এর এই ক্ষমতা ব্যবহার করে, আপনি আপনার ডেটা বিশ্লেষণের কাজকে আরও দ্রুত এবং কার্যকরভাবে সম্পন্ন করতে পারেন।
common.read_more